A Peek Into the Memory of T5: Investigating the Factual Knowledge Memory in a Closed-Book QA Setting and Finding Responsible Parts

نویسندگان

چکیده

Recent research shows that Transformer-based language models (LMs) store considerable factual knowledge from the unstructured text datasets on which they are pre-trained. The existence and amount of such have been investigated by probing pre-trained Transformers to answer questions without accessing any external context or (also called closed-book question answering (QA)). However, this is spread over parameters inexplicably. parts model most responsible for finding an only a unclear. This study aims understand T5 reaching in QA setting. Furthermore, we introduce head importance scoring method compare it with other methods three datasets. We investigate important looking inside attention heads novel manner. also why some more critical than others suggest good identification approach. demonstrate retaining through series pruning experiments. roles encoder decoder

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

investigating the integration of translation technologies into translation programs in iranian universities: basis for a syllabus design in translation technology

today, information technology and computers are indispensable tools of any profession and translation technologies have become an indispensable part of translator’s workstation. with the increasing demands for high productivity and speed as well as consistency and with the rise of new demands for translation and localization, it is necessary for translators to be familiar with market demands an...

investigating the interaction of language knowledge and strategic competence in the performance of efl learners on reading-to-write and writing-only test tasks

این مطالعه به دو روش کمی و کیفی و با هدف بررسی استراتژی های فراشناختی فراگیران زبان انگلیسی به عنوان زبان خارجی در دو آزمون نوشتن و نوشتن ترکیبی انجام پذیرفت. در بخش کمی برای سنجش میزان استراتژی های فراشناختی از یک پرسشنامه که بر اساس مدل بکمن و پالمر (1996) ساخته شده بود استفاده شد. پایایی و روایی سازه ی پرسشنامه هنگام مطالعه ی پایلوت و روایی محتوای آن با جمع آوری نظرات نُه متخصص در رشته سنجیده...

a study of the fifth child and ben in the world by doris lessing in the light of julia kristevas psychoanalytic concepts

این مطالعه به بررسی عوامل روانشناختی کریستوادردو رمان دوربس لسینگ،فرزندبنجم و بن دردنیای واقعی می بردازد.موفقیت یا شکست کاراکترهادر تکمیل شکست تتیزی یه کمک بدر وهم از مهم ترین دغدغه محقق می باشد.به بررسی تحلیل روانشناختی تمامی کاراکترها خصوصا بن برداخته و به دنبال نشانه هایی از جامعه شیشه ای کریستوا می باشد.

15 صفحه اول

the effects of keyword and context methods on pronunciation and receptive/ productive vocabulary of low-intermediate iranian efl learners: short-term and long-term memory in focus

از گذشته تا کنون، تحقیقات بسیاری صورت گرفته است که همگی به گونه ای بر مثمر ثمر بودن استفاده از استراتژی های یادگیری لغت در یک زبان بیگانه اذعان داشته اند. این تحقیق به بررسی تاثیر دو روش مختلف آموزش واژگان انگلیسی (کلیدی و بافتی) بر تلفظ و دانش لغوی فراگیران ایرانی زیر متوسط زبان انگلیسی و بر ماندگاری آن در حافظه می پردازد. به این منظور، تعداد شصت نفر از زبان آموزان ایرانی هشت تا چهارده ساله با...

15 صفحه اول

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ژورنال

عنوان ژورنال: Shizen gengo shori

سال: 2022

ISSN: ['1340-7619', '2185-8314']

DOI: https://doi.org/10.5715/jnlp.29.762